Flex 和 Bison 使用方法 | 您所在的位置:网站首页 › flex 编译器 入门 › Flex 和 Bison 使用方法 |
背景知识
在学编译原理的时候,同时在做南京大学的编译原理课程实验,这里是链接,整个实验的效果是实现一个完整的 C-- 语法的编译器。C-- 语法是他们老师指定的一种类 C 语言。 Flex 和 Bison 是两个在编译前期最常实验的工具,分别是用来做 lexical analyse 和 semantic analyse 的,这两个工具的使用基本不需要很深的编译知识,只需要掌握正则表达式的书写(lexical analyse阶段使用)和上下文无关文法(semantic analyse 阶段使用),就可以完成这两个阶段的分析了。 Flex大体介绍Flex 主要是用在词法分析阶段,不需要我们去手写分析器,只需要制定好相应的正则表达式规则,他可以自动对输入文件进行词法分析。 Flex 主要在 Linux 系统下工作,安装方式也很简单。 sudo apt-get install flex 安装好 flex 之后,我们创建一个 .l 后缀的文件,这个文件里面主要由三部分组成,定义了词法分析的规则,整个文件的结构如下。 definitions %% rules %% user subroutines在编写好文件后,可以使用命令 flex file.l 进行编译,编译之后,我们会得到一个名为 file.yy.c 的文件,这个文件代码中,我们只需要使用里面的 yylex() 函数,这个函数可以读入文件中的一个词法单元,然后进行规则匹配,即词法分析。 我们可以在外部定义一个自己的 main() 进行调用,可也以在第三部分 {user subroutines} 中书写 main() 函数进行调用。便于文件的组织,这里我们使用外部文件的方式定义一个新的主函数。 主要的代码框架如下 extern File* yyin; int main(int argc, char ** args) { if (argc > 1) { if( ! (yyin = fopen(argv[1], "r"))) { perror(argv[1]); return 1; } } while(yylex()!= 0); return 0; }这个 yyin 可以理解成输入文件的文件指针,用来读取文件,在 file.yy.c 中定义。 然后我们进行整体的编译 gcc main.c file.yy.c -lfl -o scanner -lfl 参数是指定一个库函数,对于 MacOS 用户,可以使用 -ll 参数进行代替。 这样之后,对某个文件进行词法分析就可以直接运行 ./scanner test.cmm 了。 Flex 规则部分我们需要注意的是对 Flex 中的规则的编写,整个 FLex 文件分别由三个部分,第一个部分通常定义一些之后常用的正则表达式,可以简化书写,定义格式为: name definitiondefintion 是一个具体的正则表达式,而 name 是其别名,比如,如果想定义一个识别任意数字的正则表达式,可以这样定义 digit [0-9]这个 digit 就是这个正则表达式的别名,和这个正则表达式的效果一样,会和任意一个数字进行匹配。 第二部分是规则部分,即针对每一个特定的语法单元,我们对其有什么样的操作。定义格式为 pattern {action}这个pattern 和我们上面的一样,都是正则表达式,而对应的 action 则指定了如果遇到了这个 pattern 之后,我们的应对方法。这个 pattern 我们可以重新定义,也可以直接使用在第一部分定义好的对应的 name,如果使用 name,则格式为 {name}。针对一些没有匹配任何规则的词法元素,我们可以使用 . 这个 pattern 指定对应的动作。 第三部分是用户自定义的代码部分,而这部分定义的方法,函数,都应该在第一部分中进行声明,声明格式为 %{ %}这样,声明后的变量,函数和自定义的代码片段都会在 file.yy.c 中生成,方便我们调用。 完成了这三个部分后,我们就可以生成一个简单的语法分析器了。下面给出一个使用 flex 进行单词统计的完整文件。 %{ int chars = 0; int words = 0; int lines = 0; %} letter [a-zA-Z] %% {letter}+ {words ++; chars += yyleng; } \n {chars++; lines ++;} . {chars++;} %% int main(int argc, char** argv) { if (argc > 1) { if (!(yyin = fopen(argv[1], "r"))) { perror(argv[1]); return 1; } } yylex(); printf("lines are %d words are %d chars are %d\n", lines, words, chars); return 0; }这里的 yyleng 是 flex 内置提供的变量,记录当前单词的长度。 这样,整个词法分析的过程就结束了,我们可以输入对应的词法流,在语法分析阶段进行下一步的分析。而语法分析所用的工具,就是 bison。 |
CopyRight 2018-2019 实验室设备网 版权所有 |